源码 https://github.com/crownpku/Rasa_NLU_Chi 用Rasa NLU构建自己的中文NLU系统
http://www.crownpku.com/2017/07/27/%E7%94%A8Rasa_NLU%E6%9E%84%E5%BB%BA%E8%87%AA%E5%B7%B1%E7%9A%84%E4%B8%AD%E6%96%87NLU%E7%B3%BB%E7%BB%9F.html
过程:
1.搭建python环境(使用Anaconda),修改conda默认镜像地址
2.下载源码
pip install -r requirements.txt
python setup.py install
3. 安装结巴分词
conda install jieba
conda install yash
4. 下载或者训练模型。
“wikipedia和百度百科语料生成了一个total_word_feature_extractor_chi.dat,分享如下。”
链接:http://pan.baidu.com/s/1micEF0G 密码:opli
环境搭建:
Anaconda是一个用于科学计算的Python发行版
下载地址: https://repo.continuum.io/archive/Anaconda3-5.0.1-Windows-x86_64.exe
Anaconda安装参考 http://python.jobbole.com/86236/
修改镜像地址
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
打开.condarc文件修改默认镜像
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
.condarc
以点开头,一般表示 conda 应用程序的配置文件,在用户的家目录(windows:C:\\users\\username\\
,linux:/home/username/
)。但对于.condarc
配置文件,是一种可选的(optional)运行期配置文件,其默认情况下是不存在的,但当用户第一次运行 conda config
命令时,将会在用户的家目录创建该文件。